Comparación de clasificadores para el reconocimiento de notas musicales
نویسندگان
چکیده
Este artículo describe el conjunto de experimentos realizados para obtener el reconocimiento de 60 notas musicales de un piano digital por medio de técnicas de procesamiento digital de señales y clasificadores. Para la etapa de técnicas de procesamiento digital de señales se utilizaron: Frecuencia fundamental, coeficientes Cepstrales en la Frecuencia de Mel y Cepstrales de Mecánica Coclear. Para los clasificadores se consideraron Modelos Ocultos de Markov usando HTK (Hidden Markov Model Toolkit), Modelos de Mixturas Gaussianas, Redes Neuronales Artificiales y Cuantificación Vectorial. El corpus creado para este trabajo consistió de 720 notas comprendidas en un rango de cinco octavas. Se usaron 12 archivos para cada una de las 60 notas a reconocer, las cuales se grabaron a una velocidad 70 bpm (beats per minute). Los mejores resultados se obtuvieron al aplicar coeficientes CMCC como técnica y Modelos Ocultos de Markov como clasificador (100% de reconocimiento en cada octava). Igualmente se obtuvo el 100% de reconocimiento por octava al usarse coeficientes MFCC como técnica y Cuantificación Vectorial como clasificador. Palabras clave: Transcripción automática de música, procesamiento digital de señales, reconocimiento de patrones. Comparison of Classifiers for Recognition of Musical Notes Abstract. This paper describes the set of experiments performed for recognition of 60 musical notes of a digital piano using digital signal processing techniques and classifiers. In the stage of digital signal processing techniques we used: Fundamental frequency (Pitch), Mel-Frequency Cepstral Coefficients (MFCC) and Cochlear Mechanics Cepstral Coefficients (CMCC). The implemented classifiers were: Hidden Markov Models (HMM) using HTK (Hidden Markov Model Toolkit), Gaussian Mixture Models (GMM), Neuronal Networks and Vector Quantization (VQ). The created corpus for this work consists of 720 notes included in a range of five octaves. We used 12 files for each one of the 60 notes for recognition, which were recorded in a speed of 70 beats per minute. The best results were obtained applying CMCC as technic and HMM as classifier (100% This paper describes the set of experiments performed for recognition of 60 musical notes of a digital piano using digital signal processing techniques and classifiers. In the stage of digital signal processing techniques we used: Fundamental frequency (Pitch), Mel-Frequency Cepstral Coefficients (MFCC) and Cochlear Mechanics Cepstral Coefficients (CMCC). The implemented classifiers were: Hidden Markov Models (HMM) using HTK (Hidden Markov Model Toolkit), Gaussian Mixture Models (GMM), Neuronal Networks and Vector Quantization (VQ). The created corpus for this work consists of 720 notes included in a range of five octaves. We used 12 files for each one of the 60 notes for recognition, which were recorded in a speed of 70 beats per minute. The best results were obtained applying CMCC as technic and HMM as classifier (100%
منابع مشابه
Clasificadores supervisados para el análisis predictivo de muerte y sobrevida materna
El presente trabajo se basa en el análisis de los clasificadores supervisados que puedan generar resultados aceptables para la predicción de la muerte y sobrevida materna, según características de pacientes complicadas durante su gestación determinada por los expertos salubristas. Se describe la metodología del desarrollo, las particularidades de la muestra, además los instrumentos utilizados p...
متن کاملDetección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos
Resumen. Los textos periodísticos pueden clasificarse dentro del llamado género informativo si su contenido se orienta a la objetividad (descripción de los hechos ocurridos), o en el género de opinión, si incluye elementos subjetivos (como el punto de vista o ideología del autor de la nota). Uno de los problemas que se presenta en la redacción de noticias es que en las notas de tipo informativo...
متن کاملTranscripción de música polifónica para piano basada en la resolución de grupos de notas y estados finitos
Resumen En ésta Tesis se desarrolla un modelo para la transcripción musical polifónica mediante una aproximación de estados finitos y la aplicación de reglas de decisión basadas en heurísticas para la resolución de grupos de notas. El sistema de transcripción desarrollado se implementa mediante un diagrama de estados finitos que representan grupos de notas, es decir, conjunto de notas que suena...
متن کاملIntegración de optimización evolutiva para el reconocimiento de emociones en voz
Resumen. En este art́ıculo se presenta el desarrollo de un sistema de reconocimiento de emociones basado en la voz. Se consideraron las siguientes emociones básicas: Enojo, Felicidad, Neutro y Tristeza. Para este propósito una base de datos de voz emocional fue creada con ocho usuarios Mexicanos con 640 frases (8 usuarios × 4 emociones × 20 frases por emoción). Los Modelos Ocultos de Markov (Hid...
متن کاملReconstrucción de caracteres para mejora de sistemas OCR con RNA's
Resumen. Numerosos avances dentro de la Inteligencia Artificial han estado inspirados en las caracteŕısticas de los procesos biológicos de las redes neuronales. Estas caracteŕısticas, por las ventajas que presentan, han intentado ser emuladas dentro de una computadora para imitar las tareas que son capaces de realizar los seres humanos. Siendo el OCR (Optical Character Recognition) una habilida...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- Research in Computing Science
دوره 120 شماره
صفحات -
تاریخ انتشار 2016